Découverte des dépendances fonctionnelles conditionnelles fréquentes
نویسندگان
چکیده
Résumé. Les Dépendances Fonctionnelles Conditionnelles (DFC) ont été introduites en 2007 pour le nettoyage des données. Elles peuvent être considérées comme une unification de Dépendances Fonctionnelles (DF) classiques et de Règles d’Association (RA) puisqu’elles permettent de spécifier des dépendances mixant des attributs et des couples de la forme attribut/valeur. Dans cet article, nous traitons le problème de la découverte des DFC, i.e. déterminer une couverture de l’ensemble des DFC satisfaites par une relation r. Nous montrons comment une technique connue pour la découverte des DF (exactes et approximatives) peut être étendue aux DFC. Cette technique a été implémentée et des expériences ont été menées pour montrer la faisabilité et le passage à l’échelle de notre proposition.
منابع مشابه
Mining Frequent Queries in Star Schemes
Résumé. L’extraction de toutes les requêtes fréquentes dans une base de données relationnelle est un problème difficile, même si l’on ne considère que des requêtes conjonctives. Nous montrons que ce problème devient possible dans le cas suivant : le schéma de la base est un schéma en étoile, et les données satisfont un ensemble de dépendances fonctionnelles et de contraintes référentielles. De ...
متن کاملRecherche de dépendances fonctionnelles et de règles d'association avec OLAP
Dans l’étude des bases de données, il est intéressant de déceler les liens entre les attributs. Pour ça, plusieurs outils sont disponibles. Les Règles d’Association (RA) permettent de savoir quelles valeurs des attributs dépendent d’autres valeurs. Les Dépendances Fonctionnelles (DF) permettent de savoir quels attributs dépendent des autres. Les RA donnent des informations à un niveau de granul...
متن کاملDécouverte Personnalisée de Services Web Sémantiques
Résumé. La découverte des services web sémantiques (SWSs) peut retourner un nombre important de services qui offrent des fonctionnalités similaires. La découverte personnalisée vise à complémenter la phase de découverte par une phase de sélection et de rangement en tenant compte des préférences de l’utilisateur. Nous proposons d’utiliser les propriétés non fonctionnelles (NFPs) pour personnalis...
متن کاملInférence dans les HMM hiérarchiques et factorisés : changement de représentation vers le formalisme des Réseaux Bayésiens
Une limite essentielle des HMM, et plus généralement des modèles de Markov, concerne le passage à l’échelle, l’impossibilité de la prise en compte efficace de l’influence de phénomènes indépendants et la difficulté de généralisation. Pour répondre à ces problèmes, plusieurs extensions existent. En particulier, nous nous intéresserons dans ce qui suit à la hiérarchisation (Theocharous et al. 200...
متن کاملDétection de clefs pour l'interconnexion et le nettoyage de jeux de données
Résumé : Cet article propose une méthode d’analyse de jeux de données du Web publiés en RDF basée sur les dépendances de clefs. Ce type particulier de dépendances fonctionnelles, largement étudié dans la théorie des bases de données, permet d’évaluer si un ensemble de propriétés constitue une clef pour l’ensemble de données considéré. Si c’est le cas, il n’y aura alors pas deux instances posséd...
متن کامل